🎯2018.08.18 curveball 优化算法推导
2018-8-18
| 2022-12-18
字数 227阅读时长 1 分钟
type
status
date
slug
summary
tags
category
icon
password
 
前段时间,VGG 的一拨人搞了个叫 curveball 的优化算法,能够将二阶信息用起来,同时避免了之前的传统方法要么去近似 Hessian 矩阵的逆,要么通过 conjugate-gradient 的方法去得到 Hessian 矩阵的逆,这些传统方法既耗时又对噪声敏感。而 curveball 算法并不需要直接算 Hessian 矩阵和它的逆,每次只是去估计梯度与 Hessian 矩阵的乘积即可,所付出的代价仅仅是额外的两次正向传播。 由于这篇文章写的极为简略,很多过程都直接略掉了,今天我们就来推导这个算法,将作者略去的部分补上。
 
文章链接:点我
文章代码 github 链接:点我
本文推导内容的 pdf 链接:点我

推导细节

notion image
notion image
notion image
notion image
notion image
 
 
 
  • 优化算法
  • 推荐
  • 算法
  • 2020.03.18 数据流采样优化2018.06.09 神经网络的二阶导推导
    Loading...
    目录